• 2021 - 2022
  • Traitement Automatique des Langues

Travail à faire

Intégrer le traitement d'étiquetage avec treetagger et udpipe sur les contenus des balises TITRE et DESCRIPTION de tous les fichiers de l'« arborescence de fils » à partir du programme bao1.

Construire en sortie un fichier structuré regroupant l’ensemble des traitements d’étiquetage.

Script Perl
script icon
Résultats

Ainsi, nous avons pu étiqueter les données textuelles et transformer le résultat d'udpipe en xml.

Méthode TXT XML
Udpipe Cliquez ce lien Cliquez ce lien
Treetagger Cliquez ce lien Cliquez ce lien

Script Python

script icon